FILTER MODE ACTIVE

#генерация проверяемого кода

Найдено записей: 1

#генерация проверяемого кода23.06.2025

VERINA: новый стандарт оценки генерации проверяемого кода с помощью LLM и формальных доказательств

VERINA представляет комплексный бенчмарк для оценки LLM в генерации проверяемого кода, объединяя код, формальные спецификации и доказательства с разным уровнем сложности.